数字商务泛化的黑暗面是欺诈尝试的增加。为防止任何类型的攻击,现代最先进的欺诈检测系统现在嵌入机器学习(ML)模块。这种模块的概念仅在研究水平上传达,论文主要关注孤立的基准数据集和度量的结果。但研究只是旅程的一部分,前面是业务问题的正确制定以及数据集合,然后是实际集成。在本文中,我们对该过程进行了更广泛的愿景,就转让学习进行欺诈检测,从企业进行研究,回到业务。
translated by 谷歌翻译
SNCF, the French public train company, is experimenting to develop new types of transportation services by tackling vehicle routing problems. While many deep learning models have been used to tackle efficiently vehicle routing problems, it is difficult to take into account time related constraints. In this paper, we solve the Capacitated Vehicle Routing Problem with Time Windows (CVRPTW) and the Capacitated Pickup and Delivery Problem with Time Windows (CPDPTW) with a constructive iterative Deep Learning algorithm. We use an Attention Encoder-Decoder structure and design a novel insertion heuristic for the feasibility check of the CPDPTW. Our models yields results that are better than best known learning solutions on the CVRPTW. We show the feasibility of deep learning techniques for solving the CPDPTW but witness the limitations of our iterative approach in terms of computational complexity.
translated by 谷歌翻译
斑点过滤通常是分析合成孔径雷达(SAR)图像的先决条件。在单像伪装的领域取得了巨大进步。最新技术依靠深度神经网络来恢复SAR图像特有的各种结构和纹理。 SAR图像的时间序列的可用性提供了通过在同一区域结合不同斑点实现来改善斑点过滤的可能性。深度神经网络的监督培训需要无基真斑点图像。这样的图像只能通过某种平均形式,空间或时间整合间接获得,并且不完美。考虑到通过多阶段斑点滤波可以达到非常高质量的恢复的潜力,需要规避地面真相图像的局限性。我们将最新的自我监督训练策略扩展到了称为Merlin的单外观复杂SAR图像的情况,以进行多个颞滤波。这需要对空间和时间维度以及复杂幅度的真实组件和虚构组件之间的统计依赖性来源进行建模。使用模拟斑点上的数据集进行定量分析表明,当包括其他SAR图像时,斑点减少了明显改善。然后,将我们的方法应用于Terrasar-X图像的堆栈,并显示出优于竞争的多阶段斑点滤波方法。在$ \ href {https://gitlab.telecom-paris.fr/ring/multi-temporal-merlin/} {\ text {gitlab}} $上LTCI实验室,T \'El \'Ecom Paris Institut Polytechnique de Paris。
translated by 谷歌翻译
比特币是将交易存储在公开分布的分类帐中的第一个和最高价值的加密货币。了解比特币参与者的活动和行为是一个关键的研究主题,因为它们在交易网络中是假名。在本文中,我们提出了一种基于污点分析来提取污点流的方法 - 动态网络,代表从初始源传递到其他参与者直至溶解的比特币序列。然后,我们应用图形嵌入方法来表征污点流。我们用顶部采矿池的污染流来评估我们的嵌入方法,并表明它可以高精度对采矿池进行分类。我们还发现,同一时期的污染流都显示出很高的相似性。我们的工作证明,追踪资金流可以是对源参与者分类和表征不同资金流程模式的有前途的方法
translated by 谷歌翻译
出现了前两种算法,作为汤普森采样对多臂匪徒模型中最佳手臂识别的适应(Russo,2016),用于武器的参数家族。他们通过在两个候选臂,一个领导者和一个挑战者中随机化来选择下一个要采样的臂。尽管具有良好的经验表现,但仅当手臂是具有已知差异的高斯时,才能获得固定信心最佳手臂识别的理论保证。在本文中,我们提供了对两种方法的一般分析,该方法确定了领导者,挑战者和武器(可能是非参数)分布的理想特性。结果,我们获得了理论上支持的前两种算法,用于具有有限分布的最佳臂识别。我们的证明方法特别证明了用于选择从汤普森采样继承的领导者的采样步骤可以用其他选择代替,例如选择经验最佳的臂。
translated by 谷歌翻译
在纯探索问题中,依次收集信息以回答关于随机环境的问题。虽然近年来对线性匪徒的最佳武器识别进行了广泛的研究,但很少有作品专门用于识别一只手臂,即$ \ varepsilon $ close close close to to to to to to n of the $ \ varepsilon $ close(也不是最好的一只)。在这个有几个正确答案的问题中,识别算法应重点放在这些答案之间的一个候选人上,并验证其正确。我们证明,以最高平均值选择答案不允许算法就预期的样本复杂性达到渐近最优性。相反,应识别\ textit {最远的答案}。使用该洞察力仔细选择候选人答案,我们开发了一个简单的过程,以适应最佳臂识别算法,以应对托管线性随机匪徒中的$ \ varepsilon $ best-best-andwer识别。最后,我们为此设置提出了一种渐近最佳算法,该算法证明可以针对现有的改良最佳臂识别算法实现竞争性的经验性能。
translated by 谷歌翻译
我们在固定的误差率$ \ delta $(固定信道TOP-M识别)下最大的手段识别M武器的问题,用于错过的线性匪盗模型。这个问题是由实际应用的动机,特别是在医学和推荐系统中,由于它们的简单性和有效算法的存在,线性模型很受欢迎,但是数据不可避免地偏离线性。在这项工作中,我们首先在普通Top-M识别问题的任何$ \ delta $ -correct算法的样本复杂性上得出了一个易行的下限。我们表明,知道从线性度偏差的偏差是利用问题的结构所必需的。然后,我们描述了该设置的第一个算法,这既实际,也适应了误操作。我们从其样本复杂度推出了一个上限,证实了这种适应性,与$ \ delta $ $ \ lightarrow $ 0匹配。最后,我们在合成和现实世界数据上评估了我们的算法,表现出尊重的竞争性能到现有的基准。
translated by 谷歌翻译
建立能够参与与人类社会互动的自治代理是AI的主要挑战之一。在深度加强学习(DRL)领域内,这一目标激励了多种作品上体现语言使用。然而,目前的方法在非常简化和非多样化的社交场合中关注语言作为通信工具:语言的“自然”减少到高词汇大小和变异性的概念。在本文中,我们认为针对人类级别的AI需要更广泛的关键社交技能:1)语言在复杂和可变的社会环境中使用; 2)超越语言,在不断发展的社会世界内的多模式设置中的复杂体现通信。我们解释了认知科学的概念如何帮助AI向人类智力绘制路线图,重点关注其社会方面。作为第一步,我们建议将目前的研究扩大到更广泛的核心社交技能。为此,我们展示了使用其他(脚本)社会代理商的多个网格世界环境来评估DRL代理商社交技能的基准。然后,我们研究了最近的Sota DRL方法的限制,当时在Sowisai上进行测试并讨论熟练社会代理商的重要下一步。视频和代码可在https://sites.google.com/view/socialai找到。
translated by 谷歌翻译
在深RL(DRL)社区的一个主要挑战是培养能够概括了在训练中从未见过的情况下他们的控制策略代理。在不同的任务训练已被确定为良好的泛化,从而拉高研究人员倾向于使用经过复杂的连续参数空间控制程序丰富任务生成系统的一个关键因素。在这样复杂的工作空间,必须依靠某种形式的自动课程学习(ACL)对适应任务抽样分布给定的学习剂,而不是随机抽样的任务,因为许多最终可能会成为无论是琐碎的或不可行的。因为它是很难得到这样的任务空间的先验知识,许多ACL算法探索任务空间随着时间的推移,检测进度龛,昂贵的塔布拉-rasa的过程,为每个新的学习代理执行的需要,虽然他们可能有相似之处其功能配置文件。为了解决这个限制,我们引入元ACL的概念,并在暗箱RL学习者,即算法寻求课程一代推广到学习者的(未知)分布下正式化。在这项工作中,我们提出再次元ACL的第一个实例,并在多个模拟的环境相对于传统的ACL展示其为课程发电效益,包括与不同形态的学习程序产生的跑酷的环境。视频和代码可在https://sites.google.com/view/meta-acl。
translated by 谷歌翻译
可以培训生成模型以模拟复杂的经验数据,但它们是有用的,可以在先前未观察到的环境的上下文中进行预测吗?促进这种外推能力的直观思想是具有这种模型的架构反映真实数据生成过程的因果图,使得可以独立于其他节点介入每个节点。然而,该图的节点通常是不可观察的,导致过度公开表化和缺乏因果结构的可识别性。通过定义机制独立原则,我们制定理论框架来解决这一具有挑战性的情况,以解决较弱的可识别性。我们在玩具例子上展示了经典随机梯度下降可以阻碍模型的外推能力,建议在培训期间明确地强制执行机制的独立性。关于现实世界数据培训的深度生成模型的实验支持这些见解,并说明如何利用这些模型的外推能力。
translated by 谷歌翻译